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PROCEDE GENERIQUE D'AIDE AU PLACEMENT D' APPLICATIONS DE TRAITEMENT DE SIGNAL SUR 
CALCULATEURS PARALLELES. 

(§) l-€ procede de rinvention, destine au traitement de si- 
gnal systematique sur un calculateur multiprocesseurs a ar- 
chitecture parallele homogene, consiste a etablir, pour 
chaque constituant fonctionnel et physique de I'application, 
un modele defini par un ensemble de relations sur les aiffe- 
rentes variables relatives a ce constituant, afin de modeliser 
les contraintes, puis a r6soudre de fagon concurrente ces 
relations, et a en deduire au molns une solution. 
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PROCEDE GENERIQUE D'AIDE AU PLACEMENT D'APPLICATIONS DE 
TRAITEMENT DE SIGNAL SUR CALCULATEURS PARALLELES 

La prSsente invention se rapporte d un proc§de genSrique d'aide 
au placement d'applications de traitement de signal sur calculateurs 
paralleles. 

Le placement (« Mapping » en anglais) consiste a distribuer les 
5 donn6es et les traitements lies S un traitement, tel qu'une application de 
traitement de signal, sur un calculateur, en general un calculateur a 
architecture parallele. Ce placement est statique, car Tensemble des choix 
du placement est pris avant rex6cution de I'application placee. contrairement 
au placement dynamique. 

10 On connaTt, pour r6aliser le placement, de nombreux outils et 

environnements de programmation. On citera, entre autres, i'outil SynDEx de 
riNRIA pour ie traitement de signal et d'image. I'outil PTOLEMY de 
rUniversitd de Berkeley, le HPF pour le calcul sdentifique, le « FX 
compiler », le GEDEA de la Societe LOCKHEED MARTIN, ... Cependant, 

15 peu d'outils connus permettent Tautomatisation complete du placement. De 
plus, m6me si I'objectif g^n^ral des outils tels que SynDEx ou GEDEA est de 
fournir ^ Tutilisateur une aide au developpement et a Toptimisation 
d'applications temps reel implementees sur une architecture 
multiprocesseurs, g6neralement heterog^ne, en vue de la realisation rapide 

20 de prototypes, ces outils ne gferent qu'un niveau de granularite grossier (la 
granularite 6tant le degre de finesse et de precision que Ton veut.obtenir 
pour une application et son implementation sur une architecture donn^e). 
L'environnement Ptolemy est essentiellement un environnement de 
simulation et de prototypage de systSmes heterog&nes integrant du materiau 

25 et du logiciel. 

De plus, tous ces syst^mes connus permettent, en gSn^ral, 
d'estimer les performances d'un placement pour une solution donn6e, tout en 
indiquant le reseau de communication entre processeurs le plus efficace, 
ainsi qu'un code gen§r§ automatiquement pour chacun des processeurs du 

30 syst6me. 

C'est pourquoi. les langages dedies, tel le HPF, proposent des 
primitives de placement manuel. A partir de ces primitives, le programmeur 
doit determiner lui-m§me le bon placement II en r§sulte que Tutilisation des 
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ressources offertes par des super-calculateurs comportant de tres nombreux 
processeurs est loin d'etre optimale. tar^t la fonction de placement est 
complexe. En effet, cette fonction inclut le decoupage, la distribution et 
I'alignement des donn6es sur les differents processeurs. la repartition des 

5 taches de calcul et de communication, ainsi que leur ordonnancement dans 
le temps. De plus, chaque choix relatif a I'une de ces fonctions est 
intimement lie ^ I 'architecture du calculateur et aux caract6ristiques 
physiques des architectures paralleles. 

La pr6sente invention a pour objet un precede g^nSrique d'aide au 

10 placement d'applications de traitement de signal syst§matique sur un 
calculateur d architecture parallele homog^ne. proced§ qui pemnette 
d'obtenir automatiquement au moins une solution optimis6e de placement, S 
un niveau de granularite aussi fin que possible, et ce, ^ partir d'une 
description fonctionnelle complete de I'application. et du calculateur utilise. ^. 

15 Le proc6de conforme a I'invention consiste, pour chaque 

constituant fonctionnel et physique de Tapplication, a etablir un modele defini 
par un ensemble de relations sur les differentes variables relatives d ce 
constituant. afin de modeliser les contraintes. h r6soudre de fafon 
concurrente les relations ainsi etablies. ^ en deduire au moins une solution, 

20 et, en cas d'obtention de plusieurs solutions, k choisir celle optimisant au 
moins un critfere. 

Les contraintes sont celles relatives aux sous-fonctions de la 
foncUon de placement, d savoir: le partitionnement. Talignement. la 
distribution de donn6es et le s§quencement des traitements. 
25 La pr6sente invention sera mieux comprise ^ la lecture de la 

description detaill6e d'un mode de mise en oeuvre. pris S litre d'exemple non 
limitatif et illustr6 par le dessin annex6. dont la figure unique est un schema 
fonctionnel de la fonction placement, mise en oeuvre conform6ment a 
•'invention. 

30 La presente invention se rapporte au traitement de signal 

systematique, c'est-a-dire non conditionnel. non soumis d des ordres ou 
actions exterieurs. Ce traitement est. en outre, detemiiniste et structure. Ce 
traitement peut §tre. par exemple, de la compression d'impulslons ou le 
calcul de transform§es de Fourier (FFT). 
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Les applications de traitement du signal systdmatique sont 
fonn6es de sequences de tSches, que Ton peut exprimer par des nlds de 
boucles (boucles imbriqu6es et a bornes definies) bien structures at 
parall^les. Chaque nid de tx)ucles contient un appel d une procedure ou 
5 macro-instruction correspondant en g^n^ral ^ une transformation de tableau 
c'est-^-dire d une fonction d'une librairie de traitement du signal telle qu'une 
FFT. Une telle transformation a §te decrite dans le brevet fran^ais n** 2 732 
787. Les traitements sont rSguliers (non soumis S des tests ext^rieurs) et 
s'effectuent sur des signaux multi-dimensionnels, les donn§es sont 

10 organis§es en grands tableaux dont les dimensions (par exemple source, 
firdquence. temps de rdcurrence, temps de pointage) portent les vecteurs sur 
lesquels vont s'effectuer les traitements individuels. Le tableau s'adapte 
facilement aux dimensions du systdme de capteurs, et permet de donner 
informatiquement la formulation math^matique des traitements. Ainsi, les 

15 indices des variables composant les formules deviennent des indices de 
tableaux. 

Ces procedures ont un cout d'ex^cution fix§, Indus dans la 
specification de Tapplication. Celle-ci est globalement representee par un 
graphe de flot de donnees acyclique. L'application est, en effet, sous forme 

20 d'asstgnation unique, c'est-d-dire que chaque element de tableau n'est mis 
qu'une seule fois d jour par rapplication. Dans une mise en oeuvre parallele, 
la distribution de ce grand tableau sur les nceuds de calcul change d'un 
traitement au suivant. provoquant ainsi un probldme classique du 
paralieiisme : le changement d'axe, ou « comer turn consommant 

25 beaucoup de ressources de communication. 

Pour pouvoir mettre en oeuvre Tinvention, il faut decrire 
fonctionnellement Tapplication de traitement de signal, et plus 
particulierement les composantes de cette applications, a savoir les taches. 

Une tache. aussi appeiee, routine, procedure ou traitement, 

30 accepte en entree et en sortie un ou plusieurs flux de donnees. Ces flux sont 
definis S partir des tableaux d'entree et de sortie, de la fa^on exposee dans 
le susdit brevet fran9ais n"" 2 732 787, et que Ton rappelle succlnctement ci- 
dessous. Sur chaque tableau considere, un flux reprSsente les donnees 
accedees en lecture ou ecriture par un t un seul traitement eiementaire. 

35 L'ensemble de ces donnees constitue un accds eiementaire ou domaine d 
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la transformation 6l6mentaire. Un mfeme traitement est r§il6r6 sur un espace 
d'iteration defini par I'application. Certaines proprietes sent associ6es d ce 

noeud du traitement : 

• La formulation du traitement . elle deait la formule de la 
transformation elementaire. Les donn^es de sortie sont 
exprimees en fonction des donnees d'entree. Les acc^s 
el6mentaires en lecture ou en dcriture sont specifies en 
fonction des indices des tableaux. Les dimensions des 
tableaux et I'espace m§moire requis pour ex6cuter un 
traitement sur tout I'espace d'iteration du traitement sont 
6galement specifies. 

• La complexity du calcul : elle exprlme la puissance de calcul 
requise par le noeud de traitement en op6rations/seconde. Elle 
est Ii6e d I'architecture utilis6e, et repr6sente una donn6e 
d'entrSe de I'application. 

Le flux de donnees peut etre conditionn6 par les donnees ou les 
indices des tableaux (il depend de I'application). Comme pour les noeuds. 
des propri6tes sont associ^es aux flux de donn6es : 

• Le codage des donn6es. Celles-ci sont codees sur un certain 
nombre de bits (12-16-32-64-...). elles repr6sentent 
generalement des nombres r§els ^ virgule fixe ou bien des 
nombres complexes (cod6s sur deux nombres entiers). 

• La rScun-ence d'un flux. Cette valeur est une fonction de la 
puissance de calcul des traitement dont le flux provient des 
recurrences des flux entrants de ce mSme traitement. 

• L'acqulsition est consider§e comme une t&che d part enti^re 
comprenant un flux de sortie, et Line r6cun-ence (frequence 
d'acquisition). 

• Le nombre de donn6es Ii6es h une transformation 
6I6mentaire. II definit le nombre de donnees que requiert la 
transformation el6mentaire du nceud destination. Ces donnees 
sont dites produites par le noeud source et dites consomm6es 
par le noeud destination. Toutefois. il anive que des donn6es 
soient calcul6es et non utilis6es par la suite (on n'exploite pas 
la totalite des donn6es d'une bibiiotheque. qui peut §tre 



2791789 



d'usage g6n6ral), ce qui n'Implique pas de duplication de 
calcul. 

Les acc6s el§mentaires S un tableau sent des fonctions afTines 
des indices de ce tableau, des constantes et des variables scalaires priv6es. 
5 L'espace d'it6ration d'un traitement est quant a lui completement defini par 
des fonctions affines portant uniquement sur les indices des differents 
tableaux. 

Plus precls6ment, une tache se decompose en deux parties : 

• L'espace d'it6ratlcns externa decrivant le domalne de 
10 calculs. L'une des dimensions peut etre infinie. Elle repr6sente 

le temps. Ce domaine est repr§sente par un nid de boudes 
parfaitement Imbriqu6 et totalement parall§le. li n'y a aucune 
d^pendance en Venture, par contra, il peut exister des 
recouvrements en lecture. C'est ce domalne de calculs qu'il 
^ 5 faut placer et ordonnancer sur la machine parallele. 

• L'espace d'lt^rations Interne decrivant I'ensemble des 
donn6es qui sont utiles au calcul de la macro-instruction ou 
procedure. Les fonctions d'accfes aux Elements de tableau sont 
des fonctions pseudo-affines. Des fonctions modulo sont 

20 parfois utilisees pour prendre en compte le caract§re cydique 

des capteurs pouvant etre relies au calculateur. 
On peut utiliser comme formalisme de description fonctlonnelle de 
rapplication de TSS (traitement de signal syst§matique) un graphe de flot de 
donn6es (Data Flow Graph) qui peut provenir de n'importe quel formalisme 
25 classique de description d'application du signal sous reserve qu'il contienne 
les informations pr6cis§es d-dessus. En particulier. on peut decrire 
rapplication d partir des langages suivants : 

• Le langage « Array-OI » (expos6 dans le susdit brevet fran?ais 
2 732 787). 

30 • Le langage ALPHA, 

• Un langage decrivant un ensemble de nids de boudes 
parfaitement imbriqu6s, 

• Ou le formalisme de description de type MD/SDF. 

Le placement consiste d distribuer automatiquement les 
35 operations de traitement de signal d effectuer sur un flot de donn6es. et ces 
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donn^es elles-m§mes, sur un calculateur d architecture multiprocesseurs 
parallele en tenant compte des differentes contraintes de ressources 
mat6rielles ainsi que des performances imposees au calculateur. 

L'architecture parallele dont il est question ici est une architecture 
parallele homog^ne, dans laquelle tous les processeurs sont identiques, de 
type SIMD/SPMD (« Single Instruction/Program Multiple Data »). c'est-^-dire 
dans laquelle tous les processeurs exdcutent la meme instruction ou la 
mfeme sequence d'instructions (par exemple un programme) sur des 
donn6es differentes. Le routage de I'information entre les diff^rents 
processeurs est de type statique. c'est-a-dire que les chemins de donn6es 
entre processeurs sont imposes avant Tinitialisation de chaque mode (lis sont 
definis lors de la compilation de I'application). A un instant donn6, les macro- 
instructions ex6cutees en parallfele sur chacun des processeurs sont 
Identiques. Les donn6es n6cessaires au traitement de la macro-instruction 
doivent r6slder dans la m6moire locale du processeur qui I'ex^cute. 

Pour les applications de traitement de signal, les « dimensions » 
de l'architecture du calculateur utilis6 sont des contraintes imperatives du 
placement. Cependant, ces contraintes ne sont pas prises en compte par les 
precedes dassiques de placement automatique (tels que les proc6des cites 
ci-dessus) et ne sont done pas traitees a cet effet dans I'^tat de I'art. Les 
paramdtres caracteristiques desdites dimensions sont : 

- Le nombre de processeurs disponibles, qui sont tous de 
puissance ^gale. 

- La puissance d'un processeur. Pour les applications de 
traitement de signal en temps r6el. le temps de latence des 
calculs (temps au bout duquel les r6sultats de ces calculs sont 
disponibles) est tres important. Ce temps peut etre bom6 par 
une valeur maximale. et il depend de la puissance du 
processeur qui realise le calcul. Cette puissance est exprim6e 
en nombre de cycles de calcul par seconde. 

- La memoire disponible. Elle est repartie uniform6ment sur 
I'ensemble des processeurs du calculateur. 

- Les caracteristiques de communication entre processeurs. 
Elles sont d§finies en termes de bande passante. c'est-d-dire 
en nombre de cycles machine n6cessaires d assurer la 
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communication d' un paquet de donn^es entre les processeurs 
d'une paire de processeurs. La durSe des communications 
n'est aiors pas fonction de la topologie du calculateur. 
Le placement dont il est question ici comprend tes quatre sous- 
5 fonctions de partitionnement d'alignement. de distribution et de 
s6quencement. Jusqu'a present, ces quatre sous-fonctions etaient traitees 
chacune s6parement. Par centre, la pr6sente invention prevoit de traiter 
simultanement ces sous-fonctions et de fa?on concurrente. Ce placement 
permet de trouver Tadequation entre un programme (dont ie parallelisme est 
10 sp§cifie ou non) et un calculateur a architecture parallele homogene telle que 
sp6cifiee ci<lessus. II consiste S distribuer les traitements et les donnees sur 
les diff^rents processeurs du calculateur et d 4tablir leur s^quencement, en 
optimisant le parallelisme de Tapplication. 

Ce placement comprend la determination des diverses contraintes 
15 li^es d I'application. Ces contraintes sent, d'une part, des contraintes 
« appltcatives » (liees d la taille des taches elementaires sp6cifiques du 
traitement de signal systematique), d'autre part des contraintes li^es ^ 
I'architecture du calculateur (nombre de processeurs, capacity m§moire, 
topologie du r6seau de processeurs et debit de donn6es. et enfin des 
20 contraintes liees ^ rex6cution (ordonnancement affine, recouvrement entre 
les communications de donn§es et les calculs effectues). 

La modelisation par contraintes consiste essentiellement ^ etablir, 
pour cheque contrainte, une relation entre au moins deux variables ou une 
relation entre une variable et une valeur donn^e (gSneralement un seuii). 
25 Cette relation est une relation Iin6aire (gen§ralement un polyndme du 1^ 
degre). 

Le proc6dd de rinvention, partant de cette mod§lisation, effectue 
la resolution concurrente (non s^quentielle) de tous les modeles, pour en 
deduire une ou plusieurs solutions satisfaisant toutes les contraintes. Dans le 
30 cas de plusieurs solutions satisfaisantes, on peut choisir celle satisfaisant de 
la meilleure fa^on un ou plusieurs criteres (dont des exemples sont cites d- 
dessous), et on peut avantageusement proc6der de fa^on heuristique. 

Les langages de specifications d'applications de signal, les 
polyn6mes en nombres enliers et les applications affines permettent de 
35 modSliser prdcis^ment les fonctionnalites du placement. L'algebre linSaire 
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permet de construire les differents modeles au niveau de granularite requis 
par la cotnplexlte du probleme g6n6ral. Ces modeles sont issus de I'etat de 
I'art du placement automatique [J. Li & M. Chen. « The data alignment phase 
in compiling programs for distributed memory machines », Journal of Parallel 

5 and Distributed Computing, p. 213-221. Vol. 13. 1991 ; P. Feautrier. 
« Toward Automatic Distribution », Parallel Processing Letters, p. 233-244, 
Vol. 4. n° 3, 1994 ; M. Dion, « Alignement et distribution en parallelisation 
automatique ». Thdse Informatique. ENS. LYON. 1996] et ont fait I'cbjet 
d'une adaptation au contexte applicatif du signal, lis sont exprim6s d Taide de 

10 contraintes Iin6aires et non Iin6alres integrables au proc§de de I'invention. 
Ce proc§de s'impose alors d'une part par sa capacity a traiter I'algebre 
propre aux differents modeles et d'autre part par sa dimension de langage 
qui facilite ['expression et la composition d'heuristiques et de contraintes 
sp6cifiques d un domaine, et/ou de strategies complexes permettant le 

15 contr6!e des etapes de resolution. Les donnees manipulees par le systeme 
de placement sont done des elements de tableaux, des macro-instructions, 
dont il faut n^cessairement modeliser le comportement selon les fonctions d 
r6soudre. L'ensemble des modeles d§crits ci-dessous sont enti^rement 
formalisms ^ partir de I'algebre Iin6aire. permettant le controle de la 

20 granularite pour chaque modele. Chaque modele definit une composante de 
la compilation d'une applicaUon de traitement du signal sur machine 
parall^le. 

• La distribution des calculs et des donn6es sur les processeurs, 
est en fait un problfeme de ressources disjonctives (exclusives 

25 les unes des autres). 

• L'ordonnancement des traitements en tenant compte des 
ressources m^moire et communications, representees par des 
contraintes capacitives. 

Le but est d'optimiser differents criteres comme la latence de 
30 I'application ou le cout (financier) de I'architecture cible. De plus, de 
nombreux modeles specifiques au probl6me de placement ont 6te 
d6velopp6s et viennent completer la description du probl6me. comme par 
exemple les communications ou le temps physique. Compte tenu du nombre 
de taches et du nombre de donn6es d considerer lors du placement, chaque 
35 modele est defini en intention plutot qu'en extension. La posslbilite de 
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travailler d plusieurs niveaux de granularite s'avere fondamentale pour le 
probleme de placement, et Ton utilise pour cela une formulation algebrlque 
du partitionnement. Celui-ci fixe la granularity des autres modeles. il 
entretient done de nombreuses relations au sein meme du modele 
5 conceptuel. De plus, les contraintes de dependances relient d de 
nombreuses reprises plusieurs modeles, ce sont done des contraintes 
globales et la clef de voute du probleme ^ r^soudre. Enfin, on dispose 
d'heuristiques locales ^ un ou plusieurs modeles, Cependant. on ne connaTt 
pas d'heuristique globale. Le coeur de la prdsente invention utilise I'approche 
10 multi-modeles par contraintes concurrentes [J. Jourdan, F. Pages, D. 
Rozzonelli & A, Demeure, « Data Alignment and Task Scheduling On Parallel 
Machines Using Concurrent Model-based Programming », Proc. ILPS 94, 
1994], ce qui permet d'apprehender le problfeme du placement automatique 
de mani^re globale. 

15 Selon ie precede de I'invention. ies modeles sont etabiis d raison 

d'un modele par constituant, qu'il soit fonctionnel ou physique. Par definition, 
un modele doit etre vu comme I'ensemble des sp6cifications du 
comportement du constituant qu'il modelise. 

On a represents sur le schema fonctionnel de la figure unique du 

20 dessin les differents modeles mis en oeuvre pour ia fonction « placement » 
r6ferencee 1 dans son ensemble. Ces modeles sont : Tarchitecture des 
processeurs cibles (2), la capacite de la m6moire (3), le partitionnement des 
Acts de donn§es (4), les communications inter-process eurs (5), 
Tordonnancement 6venementiel ou s§quencement des calculs (6), le temps 

25 physique ou temps de calcul (7) et les entrees-sorties de slgnaux (8). 

Les differents liens etabiis entre ces modeles sont de deux sorfes : 
les « hyperliens » repr6sent6s par des fleches complexes (9, 10) en forme de 
polygenes irr^guliers , qui relient chacune plusieurs modeles ensemble, et 
des liens simples, repr6sentes par des traits flech6s chacun ^ leurs 

30 extremites et reliant chacun deux modeles. 

La fleche complexe 9, qui correspond au critere « nombre de 
processeurs relie les modeles 2, 3, 4 et 5. La fleche complexe 10. qui 
correspond au critere « dependances », relie les modeles 3, 4, 5 et 6. 
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Le module 2 est reli6 par des liens simples aux modeles (3) 
(entire « tailie m6moire »). 5 (critere « bande passante ») et 6 (critere 
« mode de programmation »). 

Le modele 3 et relie par des liens simples aux modeles 4 (critere 
« volume de donnees ») et 6 (critere « distance et cardinalite). 

Le modele 4 est relie par un lien simple au modele 7 (critere 

« volume de calcul »). 

Le modele 5 est relie par des liens simples aux modules 6 (critfere 
« 6v6nemGnts de communication ») et 7 (critdre « dur6e de 
communication »). 

Le modele 6 est reli6 par un lien simple au modele 7 (entire 

« distance et cardinality »). 

Enfin, le module 7 et reli6 par un lien simple au modele 8 (critfere 

« latence et recurrence »). 

Dans les modeles decrits ci-dessus. les specifications du 
comportement des differents constituents de ces modeles, sont exprim6s d 
partir de relations mathematiques. On peut done en deduire que les modeles 
sont identifies ^ I'ensemble des relations definies sur leurs variables. Ces 
relations sont soit des primitives du langage utilise (primitives faisant partie 
d'une biblioth^que de relations), soit des relations definies par I'utilisateur. 

Du fait que les modeles constituent eux-m6mes I'essentiel du 
precede, les proprietes du paradigme relalionnel (ensemble des regies 
r6glssant les relations pouvant §tre etablies entre les modules) ont des 
consequences Immediates sur les proprietes des composantes 
fonctionnelles du proc6de. Les proprietes du paradigme relationnel sont les 
sulvantes : 

• Description formelle : Les relations represented one 
description formelle du comportement du constituant. En effeL 
pour chacune des sous-fonctions du placement, une 
modelisation mathematique a ete specifiee formellement. Dans 
la plupart des cas, elle est issue des travaux des sp6cialistes 
des paralieiisations, et elle a ete adaptee non seulement au 
cadre applicatif qu'est le traitement du signal mais etendue au 
contexte de la modelisation concurrente. 
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• 4c Adirectionalit^ » : Le concept de relation penmet 
d'abandonner le paradigme fonctionnel base sur la distinction 
des entrees/sorties. Une relation assure une reversibilite totale 
des arguments. Ced permet de ne faire la distinction qu'^ 

5 rex6cution. en fonction de la nature des arguments (connus et 

inconnus). 

• « Compositionalit6 » : La composition des modeles 
relationnels est tout simpiement la conjonction logique des 
relations qui constituent le modele. Ceci implique une 

10 sSmantique simple de la compositionalite. L'ensemble des 

solutions d'un modele composite est tout simpiement 
rintersection des solutions des modeles. 
Elles contribuent d Tuniversaiite du programme. Les propri6tes du 
proc6d6 induites sont alors : 
15 • Un domaine d'utilisation elargi : Un modele peut §tre utilis6 

dans plusieurs contextes en fonction du but a r6aliser 

• Une interchangeabilit6 accrue : Un modete peut etre modifi6 
ou completement redefini par la donn§e d'une nouvelle 
specification sans avoir S intervenir sur les autres modeles. 

20 • Une compositionalit6 intrinsdque : Le modele d'un syst6me 

est construit d partir du modele de ses composants. 

• Une maintenabilitd simple : La maintenabilitS reste locale k 
chaque modele. 

• Une extensibility ais6e : Etendre un syst^me revient d le 
25 composer avec le systSme existant. 

Dans toutes les solutions logicielles connues de parallelisation, 
Tetat d'un systfeme est caract§rise par le contenu de la memoire ^ un instant 
donn6. Les operations elementaires sont la lecture et Tecriture sur, ou d 
partir de ia m6moire. L'etat d'un systeme n'est alors caracterise que par 

30 l'ensemble des valeurs des cases memoires associees aux variables qui le 
composent. La difference fondamentale entre le precede de Tinvention et les 
autres solutions logicielles est la representation de cette m6moire. Dans le 
cas de I'invention, la m6moire n'est pas r6duite d un ensemble de cases 
memoire mais constitue en elle-m§me une contrainte. Cette derni§re est 

35 capable de foumir de information partielle sur Tensemble des variables qui 
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composent le systfeme. 11 est intSressant de noter que tout le raisonnement 
mis en oeuvre par les contralntes est bas§ sur ce paradigme de manipulation 
d'infomiations partielles. L'avantage des contraintes est tout simplement du 
au fait que le systeme en cours d'elaboration peut prendre des decisions 
sans avoir d attendre qu'il soit enti^rement determine. 

La resolution d'applications industrielles ne se cantonne pas d une 
probl§matique bien definie. mais integre la combinaison de plusieurs sous- 
problemes. II faut resoudre des probl^mes d'optimisation combinatoire sur 
des problemes multi-composants, multifonctions dans lesquels les 
contraintes sont trfes heterog§nes et ou il faut considerer les diff6rents 
Elements S diff6rents niveaux de granuiarite. L'invention offre des solutions 
permettant la coexistence de modeles se recouvrant partiellement, se 
coordonnant et se d^omposant. 

Une alternative pour les probl6mes multi-composants, 
multifonctions : la specification de modeles pour cheque composant et pour 
cheque fonction qui se combinent ensuite lors de la resolution d'un but. 
permet d'apporter une alternative S la resolution de problemes de systdmes. 
De plus, souvent les modules sont tres heterogdnes. Certains peuvent 
s'exprimer exclusivement a I'aide de contraintes Iin6aires. d'autres peuvent 
necessiter des contraintes symboliques ou booleennes. 

L'invention permet independamment de I'heterogeneite des 
contraintes. par de simples interactions locales, de garantir une coordination 

globale du systeme. 

Dans le cas des problemes d'optimisation combinatoire, le 
precede de l'invention offire une bonne solution technologique, car elle 
permet. lors de la resolution. I'utilisation concurrente de tous les modeles 

redondants. 

En effet : 

• La resolution de problemes hautement combinatoires se 
resume rarement a une seule formalisation mathematique. 
Souvent. pour ne pas dire toujours, des formalisations 
complementaires sont n6cessaires. Un exemple pourrait etre 
les formalisations redondantes qui tirent avantage des 
proprietes des solutions partielles, un autre exemple serait la 
prise en compte des symetries du problemes, etc. 
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• Le probleme qui se pose alors est d' utiliser en meme temps 
toutes ces informations. Dans le contexte d'approches plus 
classiques, comme la recherche op§rationnelle ou la 
programmation en nombres entiers, cette etape s'avdre 
toujours tr6s delicate. En effet, les programmes ecrits dans un 
langage imperatif n6cessitent un temps de developpement non 
negligeable et sent souvent difficiles a etendre et a modifier. 

L'invention permet egalement de resoudre les problemes 
relationnels des modeles a plusieurs niveaux de granularite. 

L'efficacite de la realisation finale depend de trois parametres. 
Tout d'abord, elle depend crucialement de Tefficacite du systeme de 
contraintes utilise, du contrdle que Ton a sur la recherche d'une solution (voir 
. ci-dessous), mais aussi, considerablement, de la granularity considSr^e dans 
la modelisation. L'exp^rience montre qu'il est indispensable de considSrer 
differents niveaux de granularite et de pouvoir raisonner sur les differents 
niveaux Ici encore, l'invention offre une solution en permettant la description, 
la coexistence et la coordination de modeles ^ differents niveaux de 
granularite. Ce dernier point n'a pas encore et6 vraiment exploite dans des 
applications. 

La fonction « placement » est alors modelisee au travers de 
differents modeles issus des travaux des sp^cialistes de la « parallelisation 
automatique » comme : 

• Le partitionnement qui exprime la distribution des calculs et 
des donndes sur les processeurs. 

• Les d^pendances qui caracterisent les iterations accedant aux 
m&mes ddnnees. 

• L'ordonnancement qui consiste d organiser rex6cution des 
traitements paralleles dans le temps, 

• L'interphase qui donne les communications entre deux 
phases de calcul partitionnees. 

• L'architecture qui est en fait un ensemble de paramfetres 
comme le nombre de processeurs, la bande passante, ... 

• Les communications. 

• La mSmoire qui definit au travers d'une contrainte de capacity 
pour laquelle on est sur de pouvoir calculer une allocation. 
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• Le signal temps r6 I qui st conslitu6 de la latence et des 

contraintes d'entr§es/sorties {p6riodes, ...). 
De manifere g6n6rique. un modele se compose de definitions de 
variables sur lesquelles reposent les contraintes propres aux modeles. 

Le proc6de de I'invention permet a la fbis de r6soudre le probleme 
du placement automatique d'applications traitement de signal sur machines 
paralleles et permet a I'utilisateur de manipuler une solution fournie sans 
violation des contraintes pos6es par le systeme global. Cette approche 
s'inscrit dans un contexte de codesign et de prototypage virtuel. A partir 
d'une description formelle de I'application (comme par exemple un langage 
de type MD/SDF d§velopp§ ^ Berkeley, une description fonctionnelle en 
ARRAY-OL ou une sp6cif»cation a I'aide de nids de boudes) I'outil produira 
un pseudo^de g6n6rique de placement pour des machines cibles 
homogfenes consid§r6es. Ce pseudo-code sera ensuite directement 
Interfagable avec les differents compilateurs des architectures cibles. 
Ce proc6de peut done permettre S I'utilisateur : 
- de salsir une solution partielle : Tutilisateur salsit une solution 
partielle de placement et I'outil poursuit sa recherche en 
compl6tant la solution de placement qui sera valid6e par 
conception. Par exemple : 

> L'utilisateur a configure sa machine avec un nombre 
insuffisant de prooesseurs pour le type de placement qu'il 
d6sire. Le proc6de va permettre de trouver le nombre 
minimal de processeurs n6cessaires au placement 
impost dans I'ensemble des processeurs disponibles. 

> L utilisateur peut imposer un s6quencement des calculs. 
Le systeme va alors trouver les partitionnements. c'est-^- 
dire les distributions des donn6es et des calculs en 
m§molre et sur les processeurs ad6quats. 

> De mfeme. I'utilisateur peut imposer un partitionnement 
initial, le systeme va trouver les ordonnancements 
compatibles. 

- de jouer sur les compromis (« trade-off ») usuels : le precede 
pem>et a TutUisateur de vallder les compromis entre I s param6tres 
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sensibles du placement en phase de conception de 
I'application, compromis entre : 

> Nombre de processeurs/Bande passante, 

> Memoire/temps r6el. 

> Nombre de processeurs/temps r§el, 

> Bande passante/temps r6el, 

> M^moire/Bande passante, 

de visualiser des solutions complexes comme par exemple 
Tordonnancement, le ddcoupage des donn6es. Taffectation 
etc... 

de dimenslonner la machine : le procede permet de specifier 
les ressources nScessaires pour placer une application 
particuliere sur un type de machine donnee sans violer les 
contraintes applicatives. Cela consiste ^ prendre en compte les 
dimensions et le nombre de chaque composant materiel 
(Hardware). 

> Nombre et puissance des processeurs, 

> Performance du r6seau d'interconnexions. 

> Taille et type de m^moire (memoire vive et memoire 
cache synchrone/asynchrone, disque dur), 

> Dimension des differentes interfaces systemes. 
c9e choisir le critdre d'optimisatlon du placement : 

> Dimension machine : le proced§ permet de configurer 
une machine minimale pour une application donn6e. 
L'utilisateur peut, par exemple, choisir de configurer une 
machine avec un nombre minimal de processeurs. 

> Latence : le proc6d§ permet de trouver le (ou les) 
placement(s) qui minimise(nt) le temps d'ex6cution de 
Tapplication sur une machine cible pr6definie par 
rutilisateur. 

> Efficacit6 : le procede permet de maximiser le 
parallelisme du (ou des) placement(s) de rapplication sur 
une machine cible prSdefinie par Tutilisateur. 

> Cout : en integrant un cout (financier par exemple) sur 
chacun des composants materiels, le procede permet de 
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trouver le (ou les) placement(s) de Papplication qui 

minimise(nt) ce cout. 

> Temps d'occupation de la machine le precede permei 
de trouver le (ou les) placement(s) qui minimise(nt) le 
temps d'occupation de la machine cible predefinie par 
I'utiiisateur af.n de pouvoir eventuellement placer une 
seconde application. 

> Recurrence d'entr6e ou de sortie : le proc6d6 permet 
de trouver le (ou les) placement(s) qui minimise(nl) la 
cadence d'entr^e et/ou de sortie des r6sultats produ.ts 
par un ensemble de traitements. Ces contraintes sont 
souvent impos^es dans le cadre des signaux video, 
acoustiques et/ou hyperfrequences. 

. de determiner les paramfetres du signal comme le modes 
des entrees/sorties, la latence. la recurrence (d'entr6e et/ou de 
sortie) pour une machine et une application donn6es. 
De plus, la presence d'un ensemble d'heuristiques penriet ^ 
rutilisateur de soulager la recherche d'une solution, en I'orientant. L'ing6n.eur 
peuteneffet:^^^^^^^ une ou p.usieurs heuristiques dans un ensemble 
predefini. c'est-^-dire avoir le choix de differentes solutions 
canoniques de placement. Par exemple: 
> ordonnancement des calculs au plus t6t. ou au plus tard. 

- Maximiser le paralieiisme, 

- Minlmiser les communications, 

. Recouvrir ICS communications par les calculs, 

. Maximiser la locality des donn6es dans les diff^rents 
processeurs. 
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REVENDICATIONS 

1. Procede g6n§rique d'aide au placement d'une application de 
traitement de signal sur un calculateur d architecture parallele homog^ne, 
caracteris§ par le fait qu'il consiste. pour chaque constituant fonctionnel et 
physique de Tapplication, d 6tabllr un modele defini par un ensemble de 

5 relations sur les diff§rentes variables relatives d ce constituant. afin de 
modeliser les contraintes. d r6soudre de fapon concurrente les relations ainsi 
etablies, et a en deduire au moins une solution, et a effectuer le placement 
de I'application. 

2. Proc6de selon la revendication 1 . caract6ris6 par le fait que les 
10 differents modeles mis en oeuvre sont : I'architecture des processeurs cibles 

(2). la capacite de la mSmoire (3), le partitionnement des flots de donnees 
(4), les communications inter-processeurs (5), le sdquencement des calculs 
(6),ie temps de calcul (7) et les entrees-sorties de signaux (8). 

3. Precede selon la revendication 1 ou 2, caracterisd par le fait 
15 qu'en cas d'obtention de plusieurs solutions, on choisit celle optimisant au 

moins un critdre, le choix etant fait de fagon heuristique. 

4. Procede selon Tune des revendications precedentes, 
caracteris6 par le fait que I'application est decrite fonctionnellement par un 
graphe de flot de donn6es multidimensionnelles. 

20 5. Proc6de selon la revendication 4, caracteris6 par le fait que 

Tapplication est decrite ^ partir de Tun des langages suivants : le langage 
« ARRAY-OL ». le langage ALPHA, un langage decrivant un ensemble de 
nids de boucles parfaitement imbriquds, le formalisme de description de type 
MD/SDF. 

25 
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